TruthRL: Aprendizaje por refuerzo para LLMs veraces Descubre TruthRL, un marco de RL que reduce alucinaciones en LLMs al incentivar respuestas correctas y abstención. Mejora la veracidad hasta un 37%. 2026-06-10 · 3 min